Studio di una rete di voli nei primi tre mesi del 2020 e analisi dell’impatto del COVID-19

Federica De Martin

15/02/2021

Obiettivo

L’attuale epidemia di COVID-19 ha avuto un impatto senza precedenti nel settore del trasporto aereo.

A partire da fine Gennaio 2020 molte nazioni hanno cominciato a bloccare i voli provenienti da alcuni paesi dell’Asia e successivamente, con la diffusione della pandemia anche in Europa e in America, molti paesi occidentali hanno chiuso i confini nazionali bloccando anche i voli in partenza. Di conseguenza, l’aviazione è uno dei settore che più ha sofferto e soffre tutt’ora a causa delle conseguenze della pandemia. Secondo ACI World (Airport Council International, organizzazione fondata del 1991 per rappresentare gli interessi degli aeroporti presso i governi), nel 2020 c’è stata una riduzione del 64.2% (https://aci.aero/wp-content/uploads/2020/12/Advisory_Bulletin_The_impact_of_COVID_19_on_the_airport_business.pdf) del traffico passeggeri globale che corrisponde a oltre 6 miliardi di passeggeri in meno rispetto alle previsioni pre-Covid-19. Secondo cià che riporta International Air Transport Association le compagnie aeree hanno perso almeno 84,3 miliardi di dollari nel 2020 e nel 2021 ne perderanno almeno 15,8 miliardi.

In questo studio è analizzata una rete di trasporto aereo con dati riferiti ai mesi di Gennaio, Febbraio e Marzo 2020 e l’impatto che il COVID-19 ha avuto su tale rete.

Il dataset scelto è stato creato da Xavier Olive, Martin Strohmeier e Jannis Lübbe a partire da dati derivati dalla piattaforma The OpenSky Network 2020 con l’obiettivo di illustrare la variazione del traffico aereo durante la pandemia COVID-19.

Descrizione del dataset

Il dataset è organizzato in un file .csv per ogni mese, ogni riga del file contiene le informazioni su un specifico volo. Ogni file .csv contiene i seguenti attributi:

I tre dataset riferiti ai mesi di gennaio, febbraio e marzo 2020 devono essere uniti in un unico dataset chiamato df_flight_covid.

## # A tibble: 3,921,109 x 16
##    callsign number icao24 registration typecode origin destination
##    <chr>    <chr>  <chr>  <chr>        <chr>    <chr>  <chr>      
##  1 THY183   <NA>   4ba9c1 TC-JNA       A332     <NA>   LTBW       
##  2 CES771   MU771  781858 B-30CW       A359     YSSY   EHAM       
##  3 ACA43    <NA>   c0173f C-FIUW       B77W     CYYZ   CYYZ       
##  4 CCA985   CA985  780cb6 B-2485       B748     <NA>   KSFO       
##  5 ETH726   <NA>   040087 ET-ARE       B788     SBGR   LOWW       
##  6 FJI911   FJ911  c8809d DQ-FAJ       A359     KLAX   YSSY       
##  7 HVN11    VN11   888152 VN-A896      A359     <NA>   LFPG       
##  8 UAE363   <NA>   8960e4 A6-EDC       A388     OMDB   OMDB       
##  9 VOI938   Y4938  0d036e XA-VOI       A319     KLAX   KPDX       
## 10 CSN399   <NA>   780f16 B-7185       B77W     <NA>   KJFK       
## # … with 3,921,099 more rows, and 9 more variables: firstseen <dttm>,
## #   lastseen <dttm>, day <dttm>, latitude_1 <dbl>, longitude_1 <dbl>,
## #   altitude_1 <dbl>, latitude_2 <dbl>, longitude_2 <dbl>, altitude_2 <dbl>

Il dataset risultante è formato da 3.921.109 entries e 16 attributi.

Pulizia dataset

## # A tibble: 2,320,987 x 5
##       id callsign origin destination day                
##    <dbl> <chr>    <chr>  <chr>       <dttm>             
##  1     1 CES771   YSSY   EHAM        2020-01-01 00:00:00
##  2     2 ACA43    CYYZ   CYYZ        2020-01-01 00:00:00
##  3     3 ETH726   SBGR   LOWW        2020-01-01 00:00:00
##  4     4 FJI911   KLAX   YSSY        2020-01-01 00:00:00
##  5     5 UAE363   OMDB   OMDB        2020-01-01 00:00:00
##  6     6 VOI938   KLAX   KPDX        2020-01-01 00:00:00
##  7     7 UBG315   WMKK   WMKK        2020-01-01 00:00:00
##  8     8 VOI950   KLAX   KFAT        2020-01-01 00:00:00
##  9     9 SVA834   WMKK   WMKK        2020-01-01 00:00:00
## 10    10 ACA848   VHHH   EGLL        2020-01-01 00:00:00
## # … with 2,320,977 more rows

Dataset aeroporti

Per poter eseguire l’analisi sulla rete dei voli è necessario individuare la nazione (e continente) di partenza e di arrivo del volo. Queste informazioni possono essere ricavate a partire dalle sigle degli aeroporti di partenza e di arrivo se si ha a disposizione un dataset che mappa tali sigle nelle nazioni di appartenenza dell’aeroporto. Gli aeroporti sono identificati dalla sigla ICAO che è un codice aeroportuale di quattro lettere utilizzato per indicare ogni aeroporto nel mondo. Un dataset del genere non è scaricabile gratuitamente perciò è stato costruito manualmente a partire dalle informazioni in formato JSON presenti nel sito datahub.io.

Il dataset creato icao_codes ha 57.421 entries ed è caratterizzato dai seguenti 12 attributi:

Di questi attributi sono necessari solo: ident, continent, iso-country e coordinates.

## # A tibble: 57,421 x 12
##    ident type  name  elevation_ft continent iso_country iso_region municipality
##    <chr> <chr> <chr>        <dbl> <chr>     <chr>       <chr>      <chr>       
##  1 00A   heli… Tota…           11 <NA>      US          US-PA      Bensalem    
##  2 00AA  smal… Aero…         3435 <NA>      US          US-KS      Leoti       
##  3 00AK  smal… Lowe…          450 <NA>      US          US-AK      Anchor Point
##  4 00AL  smal… Epps…          820 <NA>      US          US-AL      Harvest     
##  5 00AR  clos… Newp…          237 <NA>      US          US-AR      Newport     
##  6 00AS  smal… Fult…         1100 <NA>      US          US-OK      Alex        
##  7 00AZ  smal… Cord…         3810 <NA>      US          US-AZ      Cordes      
##  8 00CA  smal… Gold…         3038 <NA>      US          US-CA      Barstow     
##  9 00CL  smal… Will…           87 <NA>      US          US-CA      Biggs       
## 10 00CN  heli… Kitc…         3350 <NA>      US          US-CA      Pine Valley 
## # … with 57,411 more rows, and 4 more variables: gps_code <chr>,
## #   iata_code <chr>, local_code <chr>, coordinates <chr>

Attraverso il join tra tra il dataset dei voli df_flight_covid e quello degli aeroporti icao_codes è possibile ricavare la posizione degli aeroporti di partenza e di arrivo per ogni volo (stato e continente).

Il dataset finale ottenuto, df_flights_airports, è formato da 2.315.324 entries e contiene i seguenti attributi:

In questo dataset c’è un problema: la sigla per il Nord America (NA) viene letta come NA (not available), è quindi necessario riscrivere tali valori.

## # A tibble: 2,315,324 x 11
##       id callsign origin destination day                 continent_origin
##    <dbl> <chr>    <chr>  <chr>       <dttm>              <chr>           
##  1     1 CES771   YSSY   EHAM        2020-01-01 00:00:00 OC              
##  2     2 ACA43    CYYZ   CYYZ        2020-01-01 00:00:00 NA              
##  3     3 ETH726   SBGR   LOWW        2020-01-01 00:00:00 SA              
##  4     4 FJI911   KLAX   YSSY        2020-01-01 00:00:00 NA              
##  5     5 UAE363   OMDB   OMDB        2020-01-01 00:00:00 AS              
##  6     6 VOI938   KLAX   KPDX        2020-01-01 00:00:00 NA              
##  7     7 UBG315   WMKK   WMKK        2020-01-01 00:00:00 AS              
##  8     8 VOI950   KLAX   KFAT        2020-01-01 00:00:00 NA              
##  9     9 SVA834   WMKK   WMKK        2020-01-01 00:00:00 AS              
## 10    10 ACA848   VHHH   EGLL        2020-01-01 00:00:00 AS              
## # … with 2,315,314 more rows, and 5 more variables: country_origin <chr>,
## #   coordinates_origin <chr>, continent_dest <chr>, country_dest <chr>,
## #   coordinates_dest <chr>

Analisi esplorativa

Come prima analisi è stata eseguita un’analisi espolorativa del dataset df_flights_airports.

## [1] "Numero di aeroporti presenti nel dataset: 5330"
## [1] "Numero di nazioni nel dataset: 106"
## [1] "Numero di voli internazionali registrati: 711780"
## [1] "Numero di voli intercontinentali registrati: 176150"
## [1] "Numero di voli nazionali registrati: 1603544"

Distribuzione dei voli

È interessante capire quali sono le nazioni con più voli in partenza e in arrivo e quelle con meno voli in partenza e in arrivo. Successivamente, per ognuna delle nazioni trovate è ricavato il numero di aeroporti di quel paese presenti nel dataset.

## # A tibble: 6 x 4
## # Groups:   country_origin [6]
##   country_origin totale_voli nazione       n_aeroporti
##   <chr>                <int> <chr>               <int>
## 1 US                 1380418 USA                  3909
## 2 DE                  100559 Germania               69
## 3 AU                   73172 Australia              88
## 4 CA                   68274 Canada                141
## 5 GB                   63180 Gran Bretagna          63
## 6 IN                   60409 India                  41
## # A tibble: 6 x 4
## # Groups:   country_origin [6]
##   country_origin totale_voli nazione     n_aeroporti
##   <chr>                <int> <chr>             <int>
## 1 ML                       6 Mali                  1
## 2 AZ                       5 Azerbaigian           1
## 3 GT                       5 Guatemala             1
## 4 MR                       3 Mauritania            1
## 5 CY                       2 Cipro                 2
## 6 UY                       1 Uruguai               1
## # A tibble: 6 x 4
## # Groups:   country_dest [6]
##   country_dest totale_voli nazione       n_aeroporti
##   <chr>              <int> <chr>               <int>
## 1 US               1380459 USA                  3909
## 2 DE                 98729 Germania               69
## 3 AU                 73064 Australia              88
## 4 CA                 67438 Canada                141
## 5 GB                 62114 Gran Bretagna          63
## 6 IN                 60319 India                  41
## # A tibble: 6 x 4
## # Groups:   country_dest [6]
##   country_dest totale_voli nazione     n_aeroporti
##   <chr>              <int> <chr>             <int>
## 1 AZ                     6 Azerbaigian           1
## 2 MR                     5 Mauritania            1
## 3 KW                     2 Kuwait                1
## 4 OM                     2 Oman                  1
## 5 EG                     1 Egitto                1
## 6 SY                     1 Siria                 1

Distribuzione degli aeroporti

Voli giornalieri

L’organizzazione mondiale della sanità (WHO) l’11 Marzo dichiara la pandemia.

## # A tibble: 1 x 2
## # Groups:   day [1]
##   day                 voli_giornalieri
##   <dttm>                         <int>
## 1 2020-02-14 00:00:00            31459
## # A tibble: 1 x 2
## # Groups:   day [1]
##   day                 voli_giornalieri
##   <dttm>                         <int>
## 1 2020-03-30 00:00:00             9209

Voli giornalieri rispetto ai continenti

Nord America e Europa

America e Italia

Voli da e per l’Europa

Voli da e per il Nord America

Confronto con il 2019

Per avere poter effettuare un confronto sui mesi di Gennaio, Febbraio, Marzo 2019 e 2020, è stato creato un ulteriore dataset df_flights_airports_2019 con le stesse procedure effettuate per la creazione del dataset per i voli del 2020. Il grafico del 2019 ha in media un numero minore di voli giornalieri (probabilmente dovuto all’attività di raccolta di dati) ma l’andamento non evidenzia significative diminuzioni, cosa che invece è evidente per il 2020.

Rete dei voli

È possibile utilizzare queste informazioni sui voli per creare un grafo diretto in cui i nodi sono gli aeroporti e gli archi sono i voli tra due aeroporti. Il grafo ottenuto ha 5330 nodi(il numero degli aeroporti) e 2.315.324 archi (ovvero il numero di righe del dataset df_flights_airports_coordSep).

Su questo grafo sono state misurate tre misure di centralità dei nodi: in degree, out_degree e betweenness. * Quali sono gli aeroporti con un grado maggiore, ovvero quelli a cui arrivano e partono più voli?

Per rispondere a questa domanda è necessario calcolare la centralità di grado: in_degree indica il numero di voli che arrivano a un aeroporto (la popolarità dell’aeroporto) e out_degree rappresenta il numero di voli che partono da ogni aeroporto.

## # A tibble: 5,330 x 3
##    aeroporto in_degree out_degree
##    <chr>         <dbl>      <dbl>
##  1 YSSY          20870      21946
##  2 CYYZ          24680      25986
##  3 SBGR           4674       5068
##  4 KLAX          46795      54705
##  5 OMDB          14213      16084
##  6 WMKK          14154      14146
##  7 VHHH          16558      17238
##  8 YPPH           4733       4752
##  9 WSSS          13601      16623
## 10 KCVG           8695      13978
## # … with 5,320 more rows

Quali sono gli aeroporti più popolari per i voli in arrivo, ovvero con in_degree maggiore? Gli aeroporti più popolari si trovano tutti negli Stati Uniti.

## # A tibble: 10 x 5
##    aeroporto in_degree name                           iso_country municipality  
##    <chr>         <dbl> <chr>                          <chr>       <chr>         
##  1 KORD          68001 Chicago O'Hare International … US          Chicago       
##  2 KATL          61270 Hartsfield Jackson Atlanta In… US          Atlanta       
##  3 KLAX          46795 Los Angeles International Air… US          Los Angeles   
##  4 KDFW          45474 Dallas Fort Worth Internation… US          Dallas-Fort W…
##  5 KPHX          39664 Phoenix Sky Harbor Internatio… US          Phoenix       
##  6 KSFO          35654 San Francisco International A… US          San Francisco 
##  7 KLAS          34910 McCarran International Airport US          Las Vegas     
##  8 KBOS          34360 General Edward Lawrence Logan… US          Boston        
##  9 KEWR          34143 Newark Liberty International … US          Newark        
## 10 KSEA          33631 Seattle Tacoma International … US          Seattle

Distribuzione di in_degree: 62 aeroporti hanno un in_degree superiore a 10.000 mentre i rimanenti 5268 hanno un in_degree inferiore a 10.000.

* Quali sono gli aeroporti più popolari per i voli in partenza, ovvero con out_degree maggiore? 1154 aeroporti hanno un out_degree superiore a 10.000.

## # A tibble: 10 x 5
##    aeroporto out_degree name                          iso_country municipality  
##    <chr>          <dbl> <chr>                         <chr>       <chr>         
##  1 KORD           72575 Chicago O'Hare International… US          Chicago       
##  2 KATL           68496 Hartsfield Jackson Atlanta I… US          Atlanta       
##  3 KLAX           54705 Los Angeles International Ai… US          Los Angeles   
##  4 KDFW           50718 Dallas Fort Worth Internatio… US          Dallas-Fort W…
##  5 KDEN           45810 Denver International Airport  US          Denver        
##  6 KPHX           41341 Phoenix Sky Harbor Internati… US          Phoenix       
##  7 KLAS           36573 McCarran International Airpo… US          Las Vegas     
##  8 KSFO           36001 San Francisco International … US          San Francisco 
##  9 KBOS           35693 General Edward Lawrence Loga… US          Boston        
## 10 KSEA           35654 Seattle Tacoma International… US          Seattle
## # A tibble: 10 x 5
##    aeroporto     btw name                             iso_country municipality  
##    <chr>       <dbl> <chr>                            <chr>       <chr>         
##  1 KORD       1.99e6 Chicago O'Hare International Ai… US          Chicago       
##  2 KATL       1.37e6 Hartsfield Jackson Atlanta Inte… US          Atlanta       
##  3 KDFW       1.29e6 Dallas Fort Worth International… US          Dallas-Fort W…
##  4 KMSP       6.49e5 Minneapolis-St Paul Internation… US          Minneapolis   
##  5 KLAX       6.49e5 Los Angeles International Airpo… US          Los Angeles   
##  6 EDDF       6.01e5 Frankfurt am Main Airport        DE          Frankfurt am …
##  7 KPHL       5.96e5 Philadelphia International Airp… US          Philadelphia  
##  8 KIAH       5.73e5 George Bush Intercontinental Ho… US          Houston       
##  9 KCLT       5.70e5 Charlotte Douglas International… US          Charlotte     
## 10 KEWR       5.22e5 Newark Liberty International Ai… US          Newark

Variazione delle misure di centralità

Le misure di centralità fin’ora calcolate si basano su tutto il periodo Gennaio-Marzo 2020. Calcolando le misure di centralità nei singoli mesi è possibile osservare come queste sono cambiate (diminuite) con l’inizio della pandemia. Come sono variate le misure di centralità di Gennaio e di Marzo, ovvero prima e dopo l’inizio della pandemia?

## # A tibble: 10 x 5
##    aeroporto in_degree name                           iso_country municipality  
##    <chr>         <dbl> <chr>                          <chr>       <chr>         
##  1 KORD          23472 Chicago O'Hare International … US          Chicago       
##  2 KATL          21993 Hartsfield Jackson Atlanta In… US          Atlanta       
##  3 KLAX          16189 Los Angeles International Air… US          Los Angeles   
##  4 KDFW          15465 Dallas Fort Worth Internation… US          Dallas-Fort W…
##  5 KPHX          13501 Phoenix Sky Harbor Internatio… US          Phoenix       
##  6 KLAS          12899 McCarran International Airport US          Las Vegas     
##  7 KSFO          12630 San Francisco International A… US          San Francisco 
##  8 KEWR          12362 Newark Liberty International … US          Newark        
##  9 EGLL          12271 London Heathrow Airport        GB          London        
## 10 KBOS          12248 General Edward Lawrence Logan… US          Boston
## # A tibble: 10 x 5
##    aeroporto in_degree name                           iso_country municipality  
##    <chr>         <dbl> <chr>                          <chr>       <chr>         
##  1 KORD          20914 Chicago O'Hare International … US          Chicago       
##  2 KATL          17951 Hartsfield Jackson Atlanta In… US          Atlanta       
##  3 KLAX          14436 Los Angeles International Air… US          Los Angeles   
##  4 KDFW          14388 Dallas Fort Worth Internation… US          Dallas-Fort W…
##  5 KPHX          12739 Phoenix Sky Harbor Internatio… US          Phoenix       
##  6 KSFO          10543 San Francisco International A… US          San Francisco 
##  7 KSEA          10374 Seattle Tacoma International … US          Seattle       
##  8 KBOS          10253 General Edward Lawrence Logan… US          Boston        
##  9 KEWR           9798 Newark Liberty International … US          Newark        
## 10 KLAS           9721 McCarran International Airport US          Las Vegas
## # A tibble: 3,539 x 6
##    aeroporto name            municipality  in_degreeGennaio in_degreeMarzo   var
##    <chr>     <chr>           <chr>                    <dbl>          <dbl> <dbl>
##  1 LPAR      Alverca Air Ba… Vila Franca …              877              0  -100
##  2 OLBA      Beirut Rafic H… Beirut                     756              0  -100
##  3 KPWA      Wiley Post Air… Oklahoma City              732              0  -100
##  4 MMUN      Cancún Intern… Cancún                    511              0  -100
##  5 SEHI      Cotachachi Air… Cotacachi                  395              0  -100
##  6 KCAE      Columbia Metro… Columbia                   368              0  -100
##  7 KTIK      Tinker Air For… Oklahoma City              206              0  -100
##  8 RJOT      Takamatsu Airp… Takamatsu                  187              0  -100
##  9 MMCZ      Cozumel Intern… Cozumel                    163              0  -100
## 10 KN52      Jaars Townsend… Waxhaw                     122              0  -100
## # … with 3,529 more rows
## # A tibble: 10 x 5
##    aeroporto out_degree name                          iso_country municipality  
##    <chr>          <dbl> <chr>                         <chr>       <chr>         
##  1 KORD           25124 Chicago O'Hare International… US          Chicago       
##  2 KATL           24485 Hartsfield Jackson Atlanta I… US          Atlanta       
##  3 KLAX           19206 Los Angeles International Ai… US          Los Angeles   
##  4 KDFW           17178 Dallas Fort Worth Internatio… US          Dallas-Fort W…
##  5 KDEN           15770 Denver International Airport  US          Denver        
##  6 KCLT           14313 Charlotte Douglas Internatio… US          Charlotte     
##  7 KPHX           14014 Phoenix Sky Harbor Internati… US          Phoenix       
##  8 KLAS           13669 McCarran International Airpo… US          Las Vegas     
##  9 KBOS           12723 General Edward Lawrence Loga… US          Boston        
## 10 KSFO           12703 San Francisco International … US          San Francisco
## # A tibble: 10 x 5
##    aeroporto out_degree name                          iso_country municipality  
##    <chr>          <dbl> <chr>                         <chr>       <chr>         
##  1 KORD           22299 Chicago O'Hare International… US          Chicago       
##  2 KATL           20201 Hartsfield Jackson Atlanta I… US          Atlanta       
##  3 KLAX           16660 Los Angeles International Ai… US          Los Angeles   
##  4 KDFW           16185 Dallas Fort Worth Internatio… US          Dallas-Fort W…
##  5 KDEN           14221 Denver International Airport  US          Denver        
##  6 KPHX           13311 Phoenix Sky Harbor Internati… US          Phoenix       
##  7 KSEA           10958 Seattle Tacoma International… US          Seattle       
##  8 KSFO           10811 San Francisco International … US          San Francisco 
##  9 KBOS           10365 General Edward Lawrence Loga… US          Boston        
## 10 KEWR           10322 Newark Liberty International… US          Newark
## # A tibble: 1,894 x 6
##    aeroporto name           municipality  out_degreeGenna… out_degreeMarzo   var
##    <chr>     <chr>          <chr>                    <dbl>           <dbl> <dbl>
##  1 OLBA      Beirut Rafic … Beirut                     700               0  -100
##  2 KCAE      Columbia Metr… Columbia                   413               0  -100
##  3 KOKC      Will Rogers W… Oklahoma City              256               0  -100
##  4 RJOT      Takamatsu Air… Takamatsu                  196               0  -100
##  5 LTBW      İstanbul Hez… Istanbul                   156               0  -100
##  6 MMCZ      Cozumel Inter… Cozumel                    139               0  -100
##  7 MMUN      Cancún Inter… Cancún                    121               0  -100
##  8 VOTV      Trivandrum In… Thiruvananth…              109               0  -100
##  9 KTIK      Tinker Air Fo… Oklahoma City               99               0  -100
## 10 SEAS      Ascazubi Airp… Ascazubi                    93               0  -100
## # … with 1,884 more rows
## # A tibble: 10 x 5
##    aeroporto     btw name                             iso_country municipality  
##    <chr>       <dbl> <chr>                            <chr>       <chr>         
##  1 KORD       1.13e6 Chicago O'Hare International Ai… US          Chicago       
##  2 KATL       7.92e5 Hartsfield Jackson Atlanta Inte… US          Atlanta       
##  3 KDFW       6.31e5 Dallas Fort Worth International… US          Dallas-Fort W…
##  4 KPHL       3.79e5 Philadelphia International Airp… US          Philadelphia  
##  5 KMSP       3.67e5 Minneapolis-St Paul Internation… US          Minneapolis   
##  6 KLAX       3.41e5 Los Angeles International Airpo… US          Los Angeles   
##  7 KCLT       3.37e5 Charlotte Douglas International… US          Charlotte     
##  8 EDDF       3.33e5 Frankfurt am Main Airport        DE          Frankfurt am …
##  9 KEWR       3.31e5 Newark Liberty International Ai… US          Newark        
## 10 EGLL       2.95e5 London Heathrow Airport          GB          London
## # A tibble: 10 x 5
##    aeroporto     btw name                             iso_country municipality  
##    <chr>       <dbl> <chr>                            <chr>       <chr>         
##  1 KORD       1.04e6 Chicago O'Hare International Ai… US          Chicago       
##  2 KATL       6.64e5 Hartsfield Jackson Atlanta Inte… US          Atlanta       
##  3 KDFW       6.35e5 Dallas Fort Worth International… US          Dallas-Fort W…
##  4 EDDF       3.53e5 Frankfurt am Main Airport        DE          Frankfurt am …
##  5 KLAX       3.48e5 Los Angeles International Airpo… US          Los Angeles   
##  6 EGLL       3.00e5 London Heathrow Airport          GB          London        
##  7 KCLT       2.79e5 Charlotte Douglas International… US          Charlotte     
##  8 KPHL       2.64e5 Philadelphia International Airp… US          Philadelphia  
##  9 KBOS       2.61e5 General Edward Lawrence Logan I… US          Boston        
## 10 KMSP       2.44e5 Minneapolis-St Paul Internation… US          Minneapolis
## # A tibble: 4 x 6
##   aeroporto name                    municipality     btw_Gennaio btw_Marzo   var
##   <chr>     <chr>                   <chr>                  <dbl>     <dbl> <dbl>
## 1 KCAE      Columbia Metropolitan … Columbia              10262.         0  -100
## 2 KNSI      San Nicolas Island Nol… San Nicolas Isl…       7227.         0  -100
## 3 SWJX      Fazenda das Perobas Ai… Prudente De Mor…       7053.         0  -100
## 4 44PA      Pennfield Farm Airport  Spring Mills           7049.         0  -100

Visualizzazioni dei voli

Visualizziamo la mappa dei voli nei tre mesi di Gennaio, Febbraio e Marzo 2020. Per una migliore visualizzazione della mappa è stata considerata la rete in cui ogni nodo è un aeroporto e c’è un arco tra due aeroporti se c’è stato almeno un volo ma non sono ripetuti archi se ci sono stati più voli tra due nodi.

Come cambia la mappa dei voli tra Gennaio e Marzo 2020? Mappa Gennaio 2020: Mappa Marzo 2020:

Visualizziamo la mappa dei voli, tra Nord America e Europa e in Italia, in due date stabilite: 7 Gennaio (prima dell’inizio della pandemia) e 25 Marzo (durante la pandemia).

* Voli nazionali italiani del 25 Marzo. ## Componente gigante In questa rete di voli è presente una componente gigante, ovvero una componente connessa “gigante” formata da un insieme di aeroporti che sono connessi tra di loro da voli?

La componente gigante esiste ed è formata da 1.779.291 archi su 2.315.324 archi totali e da 4077 aeroporti su 5.330 aeroporti presenti nel dataset (76.5% degli aeroporti).

##   aeroporto1      lat1      lon1 aeroporto2     lat2      lon2
## 1       WMKK 101.71000   2.74558       KLAX -118.408  33.94250
## 2       VHHH 113.91500  22.30890       WMKK  101.710   2.74558
## 3       YPPH 115.96700 -31.94030       KLAX -118.408  33.94250
## 4       WSSS 103.99400   1.35019       WMKK  101.710   2.74558
## 5       KCVG -84.66780  39.04880       VHHH  113.915  22.30890
## 6       EHAM   4.76389  52.30860       YPPH  115.967 -31.94030

Considerando solo i voli di gennaio la componente gigante è di 33.300 archi (su 845.899) e 3898 aeroporti.

Considerando solo i voli di marzo la componente gigante è di 31.895 archi (su 647.463) e 3769 aeroporti.

Ricerca di comunità

È possibile individuare delle comunità in questa rete di voli, ovvero insiemi di aeroporti che sono densamente connessi tra di loro e poco connessi con aeroporti di altre comunità? Per la ricerca di comunità sono stati applicati diversi algoritmi ed è stato scelto, per le analisi successive, quello con una modularità maggiore.

##            algoritmo modularità
## 1    cluster_infomap       0.02
## 2   cluster_walktrap       0.50
## 3    cluster_louvain       0.53
## 4 cluster_label_prop       0.48

Da quanti nodi è formata la comunità più grande? La comunità più grande è formata da 2290 nodi.

## Community sizes
##    1    2    3    4    5    6    7    8    9   10   11   12   13   14   15   16 
##   88  167 2290  566  676   82    6    8    3    1    1    2    2    2    2    2 
##   17   18 
##    2    2

Visualizzazione delle tre comunità più grandi nella rete dei voli di Gennaio (pre-covid).Come si può notare ci sono due comunità incentrate negli USA: in turchese la comunità più grande con 2290 nodi e in rosa la seconda comunità più grande formata da 676 nodi. Una terza comunità con 566 nodi e rappresentata dal colore corallo è centrata in Europa.

##            algoritmo modularità
## 1    cluster_infomap       0.02
## 2   cluster_walktrap       0.42
## 3    cluster_louvain       0.47
## 4 cluster_label_prop       0.41

Delle 17 comunità individuate la più grande è formata da 2201 nodi.

## Community sizes
##    1    2    3    4    5    6    7    8    9   10   11   12   13   14   15   16 
##   80 2201  615  167   83    7  587    2    1    3   13    6    2    2    2    3 
##   17 
##    3

Visualizzazione delle tre comunità più grandi nella rete dei voli di Marzo (durante il lockdown).Come si può notare ci sono due comunità incentrate negli USA: in turchese la comunità più grande con 2201 nodi e in rosa la seconda comunità più grande formata da 615 nodi. Una terza comunità con 578 nodi e rappresentata dal colore corallo è centrata in Europa. * Considerando i voli dei mesi di Gennaio, Febbraio e Marzo risulta che la modularità maggiore si ottiene con cluster_louvain con un valore di 0.51.

##            algoritmo modularità
## 1    cluster_infomap       0.01
## 2    cluster_louvain       0.51
## 3 cluster_label_prop       0.46

L’algoritmo cluster_louvain identifica 15 comunità

## [1] 15

La comunità più grande è formata da 3091 nodi.

## Community sizes
##    1    2    3    4    5    6    7    8    9   10   11   12   13   14   15 
##  113  187 3091    8  797  984    4   14    1  120    2    2    2    2    3

Visualizziamo le sei comunità più grandi nella rete. Dalla rappresentazione si nota che sono presenti due comunità negli Stati Uniti, una comunità in Europa, una comunità in Australia, una tra India e Cina e una in Sud America.

## Conclusioni